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摘要 :【 目的 】 分 析 德 国 小 虹 Blattella germanica 全 基因 组 中 微 卫星 的 数量 和 分 布 规律 ,并 对 外 显 子 中 含有 微 卫 星 的 
基因 进行 功能 注释 。[【 方 法 】 使 用 微 卫 星 搜索 软件 查找 德国 小 蚁 基因 组 中 微 卫星 的 数量 重复 次 数 以 及 所 有 微 卫 星 
的 位 置信 息 ,编写 Python 脚本 对 微 卫 星 进行 定位 ,并 通过 Blast2Go 和 KASS 程序 对 外 显 子 中 含有 微 卫 星 的 基因 进 
行 功 能 注释 。[ 结果 】 共 找到 1 ~6 碱 基 重复 类 型 的 微 卫星 序列 604 386 个 ,总 长 度 15 301 255 bp , 约 占 全 基因 组 序 
列 ( 约 2.04 Gb) 的 0.75% ,分 布 频率 为 1/3.37 kb, 微 卫星 序列 的 长 度 主要 在 12 ~ 60 个 碱 基 长 度 范围 内 。 不 同类 型 
的 微 卫星 中 ,三 碱 基 (226 876) 重 复 类 型 微 卫 星 数 量 最 多 , 占 微 卫星 总 数 的 37.54% ; 四 碱 基 (150 355 ) 重复 类 型 次 
之 , 占 微 卫星 总 数 的 24. 88% ;其 余 依 次 是 单 碱 基 (141 167) 、 二 碱 基 (60 877) 、 五 碱 基 (21 570) 和 六 碱 基 (3 541) 
复 类 型 ,分 别 占 微 卫 星 总 数 的 23.36% , 10.07% , 3.57% 和 0.59%。 出 现 最 多 的 重复 拷贝 类 别 有 :ATT, AAT, A， 
T, AAAT, ATIT 和 AT, 共 411 789 个 微 卫星 , 占 微 卫 星 总 数 的 68. 13% ,这 7 种 类 别 的 微 卫星 数量 均 大 于 30 000 
个 。 共 有 2 372 个 微 卫 星 在 外 显 子 上 ,它们 分 别 位 于 1 481 个 基因 上 。G0 功能 注释 结果 表明 ,其 中 434 条 归 类 于 细 
胞 组 分 ( cellular component ) ,402 条 归 类 于 分 子 功 能 (molecular function ) ,660 条 归 类 于 生物 学 过 程 (biological 
process) 。KEGG 通路 分 析 结 果 表明 ,与 新 陈 代谢 相关 的 基因 最 多 (380 个 ) ,其 次 是 与 机 体系 统 相关 的 (276 个 ) ,与 
遗传 信息 进程 相关 的 基因 最 少 (92 个 ) 。[ 结论 ] 本 研究 为 进一步 系统 深入 分 析 德 国 小 申 微 卫星 功能 及 微 卫 星 分 子 
标记 筛选 打下 了 基础 。 
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Distribution patterns of microsatellites in the genome of the German 


























































































































































































































































































































































































































cockroach (Blattella germanica ) 
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of Education, College of Life Sciences, Sichuan University, Chengdu 610064, China; 2. Sichuan Key 
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Abstract: [Aim) The objective of this study is to analyze the number and distribution of microsatellites 
in the whole genome of the German cockroach, Blattella germanica, and get the functional annotation 
information of genes containing microsatellites in exons. [ Methods】The microsatellite number, repetition 
and location information were calculated by using microsatellite search tool. The distribution information 
of microsatellites in the genome was calculated by custom Python scripts, and all genes containing 
microsatellites were annotated by using the programs of Blast2Go and KAAS. 【Results】A total of 
604 386 simple sequence repeats (SSRs) with 1 - 6 bp nucleotide motifs were identified, with a total 
length of 15 301 255 bp, indicating that about 0.75% of the B. germancia genome (2.04 Gb) is occupied 
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by SSRs and that there is a locus per 3.37 kb. The length of the microsatellite sequences mainly ranges 
from 12 to 60 bp. Among different types of microsatellites, trinucleotide microsatellites (226 876, 37.54% ) 
are the most abundant SSRs, followed by tetranucleotide microsatellites (150 355, 24. 88% ) ， 
mononucleotide microsatellites (141 167, 23.36% ), dinucleotide microsatellites (60 877, 10.07% ) ， 
pentanucleotide microsatellites (21 570, 3.57% ) and hexa-nucleotide microsatellites (3 541, 0. 59% ). 
The predominant repeat types are ATT, AAT, A, T, AAAT, ATTT and AT, with a total number of 
411 789, accounting for 68. 13% of the total SSRs. The number of each of these 7 categories is greater 
than 30 000. There are 2 372 microsatellites in the exons of 1 481 genes. The results of GO annotation 
indicated that 434 GO terms are classified as cellular component, 402 GO terms are related to molecular 
function and 660 GO terms are related to the biological process. Aligned to KEGG database, most of 
these genes are associated with metabolism, followed by genes related to organismal system, and genes 
related to genetic information processing are the least. 【 Conclusion 】This study lays a foundation for 
further in-depth analysis of microsatellite function and developing microsatellite markers of B. germanica. 


Key words: Blattella germanica; microsatellite; bioinformatics; functional annotation; genome; exon 




















微 卫 星 序列 ,又 称 为 短 串 联 重复 序列 ,一般 重 复 
单位 为 1 ~6 pp, 广 泛 存 在 于 真 核 ` 原 核 和 病毒 基因 
组 中 (Tith ef al., 2000; Chen ef al., 2009; 
Castagnone-Sereno et al., 2010) ,主要 位 于 基因 组 的 
内 含 子 区 、 基 因 间 隔 区 ,也 存在 于 基因 的 外 显 子 区 
(T6th et al.,， 2000; 阁 毛 毛 等 , 2011 ) 。 其 产生 的 原 
因 主 要 是 : 滑 链 错 配 ,或 DNA 复制 、 修 复 及 重组 时 出 
现 错误 (Levinson and Gutman, 1987; Schlitterer and 
Tautz，1992 ) , 微 卫 星 还 是 目前 应 用 最 广泛 的 遗传 标 
记 之 一 (于 疾 等 ,2009 ) ,近年 来 被 广泛 应 用 于 基因 
定位 ( 胡 沈 来 等 ,2007)、 亲 子 鉴定 ( 张 于 光 等 ， 
2003 ; 钱 林 东 等 ,2010) 、 群 体 遗 传 结构 分 析 ( 张 宁 
波 , 2004; 白文 林 等 , 2007) 、 种 质 特征 ( 罗 玉 柱 等 ， 
2009 ) 等 方面 。 

德国 小 蚊 Blattiella germanica ,别名 德国 暴 螂 或 
德国 姬 虹 , 隶 属于 碍 螃 目 姬 螃 科 。 碍 归 目 昆虫 最 早 
出 现在 中 石炭 世 维 斯 发 早期 ( 梁 军 辉 等 , 2006) , 目 
前 在 全 世界 均 有 分 布 ,是 世界 性 重要 卫生 害虫 之 一 ， 
在 我 国 分 布 范围 也 较为 广泛 ( 孙 耘 挛 等 ,2004; 齐 
欣 和 孙 耘 赤 , 2004) 。 德 国 小 虹 因 其 体内 外 携带 多 
种 病原 体 ,包括 细菌 、 病 毒 、 真 菌 、 寄 生 虫 等 ,可 以 机 
械 性 传播 多 种 疾病 ;还 可 以 引起 人 的 皮肤 或 呼吸 道 
的 过 敏 反应 ( 王 伟 等 , 2011)。 研 究 表 明 , 小 景 过 敏 
原 引 起 的 呼吸 道 过 敏 是 哮喘 产生 的 重要 原因 
(Arruda et ol.，1997) 。 此 外 ,德国 小 蚁 繁殖 快 .隐蔽 
性 好 、 适 应 能 力 强 以 及 对 化 学 药剂 的 抗 性 特点 ,加 剧 
了 它 的 危害 程度 。 近 年 来 ,围绕 德国 小 蚁 分 别 开 展 
了 生态 学 、 抗 性 和 致 病 微生物 携带 方面 的 检测 研究 
( 曾 晓 总 等 , 2004; 马 义 等 , 2004; 余 向 华 , 2008)， 
但 是 由 于 之 前 小 景 基因 组 数据 的 缺乏 ,很 少 有 报道 


























































































































































































































在 基因 组 水 平 对 小 赚 进 行 研 究 。 本 研究 采用 生物 信 
息 学 的 方法 ,通过 使 用 微 卫 星 搜 索 软 件 对 小 赚 基 因 
组 中 的 微 卫 星 序列 进行 搜索 ,并 对 其 在 基因 组 不 同 
区 域 的 分 布 情况 进行 了 分 析 ,为 进一步 筛选 微 卫 星 
位 点 的 研究 提供 数据 基础 。 另 外 ,本 实验 还 对 外 显 
子 上 含有 微 卫 星 的 基因 进行 了 功能 注释 ,为 以 后 研 
究 微 卫星 在 基因 上 的 功能 提供 参考 。 
































1 研究 方法 


1.1 数据 来 源 

德国 小 赚 的 基因 组 大 小 约 2. 04 Gb, 文 件 为 
FASTA 格式 , 下载 来 源 : ftp://ftp. hgsc. bem. edu/ 
ISK-pilot/German _ cockroach/ genome _ assemblies/ 。 
小 虹 注 释文 件 大 小 28 M ,下 载 来 源 :ftp://fip. hgsc. 
edu/ISK-pilot/ German 
annotation/ 。 
1.2 数据 分 析 
1.2.1 微 卫 星 查 找 : 通过 使 用 本 实验 室 开发 的 微 
卫星 搜索 及 统计 软件 MSDB v2.4( Du ei al., 2013)， 
对 德国 小 赚 的 基因 组 进行 处 理 , 得 到 所 需 相 关 信 息 。 
微 卫星 搜索 的 标准 为 : 单 碱 基 重 复 次 数 12 次 以 上 ， 
二 碱 基 重 复 次 数 7 次 以 上 ,三 碱 基 重复 次 数 5 次 以 
上 ,四 碱 基 \ 五 碱 基 和 六 碱 基 均 为 4 次 以 上 。 
1.2.2 微 卫 星 定位 : 根据 小 景 基因 组 的 注释 信息 ， 
作者 使 用 自己 编写 的 Python 脚本 对 搜索 到 的 微 卫 
星 进 行 定位 ,判断 微 卫星 在 基因 组 上 的 具体 位 置 。 
1.2.3 Gene Ontology (GO ) 分 析 和 通路 分 析 : 对 外 
显 子 中 含有 微 卫 星 的 基因 进行 序列 提取 ,保存 为 
FASTA 格式 ,并 对 这 些 序列 进行 同 源 性 分 析 。 使 用 
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Blastx( Altschul et al.，1997 ) 将 要 比 对 的 序列 与 nr 
蛋白 质 库 进行 比 对 ,设置 E-value < 1E-5。 将 Blast 
结果 导入 Blast2Go( Conesa et al., 2005 ) 进行 GO 功 
能 注释 ,再 将 Blast2Go 结果 提交 到 WEGO( Ye et al.， 
2006 ) 对 其 按照 细胞 组 分 (cellular component ) 、 分 子 
功能 (molecular function ) 及 生物 学 过 程 (biological 
process) 进行 CO 功能 分 类 。 最 后 将 这 些 基 因 序 列 
提交 到 KAAS( Moriya et al., 2007 ) 与 KEGG 数据 库 
进行 比 对 ,以 获得 这 些 基因 参与 的 通路 信息 。 











2 结果 


2.1 不 同类 型 微 卫星 数量 和 丰 度 分 析 

对 微 卫 星 的 各 种 重复 类 型 进行 统计 ,结果 如 表 
1 所 示 。 三 碱 基 重 复 类 型 的 微 卫星 数量 最 多 , 达 
226 876 个 , 丰 度 为 111. 36 个 /Mb; 其 次 是 四 碱 基 重 
复 类 型 微 卫 星 , 为 150 355 个 , 丰 度 为 73. 80 个 /Mb; 
接 下 来 依次 是 单 碱 基 重 复 类 型 二 碱 基 重复 类 型 .五 
碱 基 重 复 类 型 和 六 碱 基 重复 类 型 的 微 卫 星 ( 表 1)。 
2.2 不 同类 型 微 卫 星 重 复 次 数 分 析 

德国 小 景 不 同类 型 微 卫 星 重复 次 数 如 图 1 所 
示 。 不 同 碱 基 重复 类 型 的 重复 次 数 变 化 范围 较 大 ， 
五 和 六 碱 基 的 重复 次 数 变 化 范围 远 远 小 于 其 他 碱 基 
类 型 。 单 碱 基 微 卫星 重复 次 数 主要 分 布 在 12 ~ 30 
次 , 占 单 碱 基 微 卫星 总 数 的 95. 56% ; 二 碱 基 微 卫星 
重复 次 数 主要 分 布 在 7 ~21 次 , 占 二 碱 基 微 卫星 总 



























































数 的 95. 85% ; 三 碱 基 重 复 次 数 主要 在 5 ~20 次 , 占 
三 碱 基 微 卫星 总 数 的 93. 71% ;四 碱 基 重 复 次 数 主 
要 在 4~15 次 , 占 四 碱 基 微 卫星 总 数 的 95. 61% ;五 
碱 基 重 复 次 数 主要 在 4 ~8 次 , 占 五 碱 基 微 卫星 总 数 
的 95.38% ; 六 碱 基 重 复 次 数 主要 在 4~8 次 , 占 六 
碱 基 微 卫星 总 数 的 95. 534% 。 可 以 发 现 , 随 着 重复 
类 别 碱 基数 目的 增加 , 微 卫 星 偏好 的 重复 次 数 逐渐 
微 卫 星 的 长 度 一 般 在 12 ~ 60 pp ,重复 次 数 的 
主要 变化 范围 在 4 ~ 30 次 , 占 微 卫 星 总 数 的 
98. 82% 。 在 二 碱 基 三 碱 基 和 四 碱 基 重复 类 型 中 都 
发 现 一 个 重复 次 数 较 高 的 微 卫星 ,分 别 达 到 4 180， 
1 558 和 320 次 ,进一步 处 理 数据 得 到 这 3 个 微 卫星 
的 拷贝 类 别 是 :TA，TAT 和 GTAT ,它们 都 位 于 基因 
间 区 。 
2.3 
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微 卫 星 重复 类 别 的 数量 分 析 

在 德国 小 嫌 基因 组 中 ,不仅 不 同 重复 类 型 的 微 
卫星 数量 差异 很 大 ,而 且 同 一 类 型 的 不 同 微 卫 星 类 
别 在 数量 上 也 有 很 大 差异 ( 表 2)。 数 目 最 多 的 是 : 
ATT, AAT, A, T，AAAT,，ATTT 和 AT, 共 411 789 
个 , 占 微 卫 星 总 数 的 68.13% , 每 种 类 别 的 微 卫 星 数 
量 都 大 于 30 000。 进 一 步 分 析 , 微 卫星 总 数 大 于 
1 000 的 拷贝 类 别 有 44 种 , 共 577 043 个 微 卫星 , 占 
微 卫 星 总 数 的 95. 48% ,其 中 不 含有 六 碱 基 重 复 类 
别 ; 总 数 大 于 100 的 拷贝 类 别 有 106 种 , 共 598 652 
个 , 占 微 卫星 总 数 的 99.05% ;总 数 小 于 100 的 拷贝 
类 别 有 427 种 ,以 五 碱 基 和 六 碱 基 重 复 类 别 为 主 。 

















































































































表 1 德国 小 赚 不 同类 型 微 卫 星 的 数量 分 布 情况 
Table 1 Distribution of SSRs in the genome of Blattella germanica 
重复 类 型 微 卫星 数目 占 微 卫 星 总 数 的 比例 ( % ) 丰 度 (个 /Mb) 
Repeat type Number of microsatellites Proportion of each repeat Abundance (number per Mb) 
单 碱 基 Mononucleotide 141 167 23.36 69.29 
二 了 碱 基 Dinucleotide 60 877 10.07 29. 88 
碱 基 Trinucleotide 226 876 37.54 111.36 
四 碱 基 Tetranucleotide 150 355 24.88 73.80 
五 碱 基 Pentanucleotide 21 570 3.57 10.59 
六 碱 苛 Hexanucleotide 3 541 0.59 1.74 
微 卫 星 总 数 Total 604 386 100 296.66 
表 2 德国 小 丹 全 基因 组 中 最 多 的 微 卫星 重复 拷贝 类 别 
Table 2 The most frequent microsatellite repeat types found in the genome of Blattella germanica 
单 碱 基 ( % ) 二 碱 基 (% ) 三 碱 基 (% ) 四 碱 基 (% ) 五 碱 基 (% ) 六 碱 基 (% ) 
Mononucleotide Dinucleotide Trinucleotide Tetranucleotide Pentanucleotide Hexanucleotide 
A(48.58) AT(56.52) ATT(37. 85) AAAT(23.38) ATTTT(11. 33) AAATAA(9.52) 
T(48.43) CT(14.45) AAT(37.23) ATTT(23. 32) AAATA(10.67) AAGTTT(S5. 68) 
G(1.54) AG(14.37) CTT(4.57) AGTT(7.70) AAATT(6.43) AAACTT(5.31) 
C(1.54) GT(7.38) AAG(4.49) AACT(7.61) AATTT(6.16) ATTTTT( 5.28) 
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Fig. 1 





A: 单 碱 基 























Tetranucleotide repeats; 上 E: 五 碱 基 重 复 Pentanucleotide repeats; 下 : 六 碱 雪 





2.4 微 卫 星 定位 

德国 小 赚 基因 组 微 卫 星 定位 结果 表明 (图 2)， 
在 基因 上 的 微 卫 星 有 58 983 个 , 既 在 基因 上 又 在 基 
因 间 区 的 微 卫 星 有 94 个 ,在 基因 间 区 的 微 卫 星 有 
545 309 个 。 对 位 于 基因 上 的 微 卫 星 进 行进 一 步 的 
定位 ,得 到 位 于 外 显 子 上 的 微 卫星 有 2 372 个 , 占 微 
卫星 总 数 的 0. 39% ,位 于 内 含 子 上 的 微 卫 星 有 
56 560 个 , 既 在 外 显 子 上 又 在 内 含 子 上 的 微 卫 星 有 
51 个 。 外 显 子 上 的 2 372 个 微 卫星 不 同 碱 基 类 型 的 
分 布 情况 如 图 3 所 示 。 外 显 子 上 三 碱 基 微 卫星 类 型 
最 多 , 共 1 427 个 ,其 次 依次 是 单 碱 基 、 二 碱 基 、 四 碱 
基 \ 六 碱 基 和 五 碱 基 类 型 ,分别 为 472, 206, 184, 44 
和 39 个 。 统 计 分 析 后 发 现 ,四 碱 基 类 型 微 卫星 相 较 
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图 1 德国 小 蚁 6 种 重复 类 型 微 卫星 的 重复 次 数 分 布 
Distribution of SSRs in six repeat types based on their copy numbers in Blattella germanica 


复 Mononucleotide repeats; B: 二 碱 基 重复 Dinucleotide repeats; C: 三 碱 基 重复 Trinucleotide repeats; D: 四 碱 基 重 复 

















重复 Hexanucleotide repeats. 


于 其 他 类 型 虽然 总 数 排名 第 二 ,但 位 于 外 显 子 上 的 
很 少 ,只 占 该 类 型 微 卫 星 总 数 的 0.12% 。 
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2 微 卫 星 在 德国 小 蚁 基因 上 的 分 布 情况 


Fig. 2 ”Distribution of microsatellites in genes 





of Blattella germanica 


















































10 其 王 “ 晨 等 : 德国 小 娘 全 基因 组 中 微 卫星 分 布 规律 1041 
= 分 布 情况 表明 :29.4% 的 序列 其 核 音 酸 序列 一 致 性 
3 1200 很 高 ( >80% ) ,70.6% 的 序列 其 昔 酸 序列 一 致 性 从 
诗 1000 15% ~ 80% 不 等 。Blast2GCo 结果 表明 ,349 个 基因 
人 有 GO term, 共 得 到 1075 个 GO term。 
时 0 WEGO 功能 分 类 结果 表明 ,434 条 归 类 于 细胞 
局 上 加 国 成 分 (cellular component ) ,402 条 涉及 分 子 功 能 
ed eo es jes es es (molecular function ), 660 条 参与 生物 过 程 
Mo ED Te ee pe Re i A i 
请 省 一 个 二 RN 所 庆 第 > (biological process ) 。 所 得 的 G0 分 类 可 以 划分 为 
42 个 更 详细 的 类 别 (图 5) , 主要 参与 的 分 子 功能 
图 3 德国 小 赔 全 基因 组 中 外 显 子 上 的 微 卫星 是 : 绑 定 活动 催化 反应 .转运 因子 和 分 子 传导 因子 。 
类 型 分 布 情况 其 涉及 的 生物 过 程 主要 是 :细胞 过 程 、 代 谢 过 程 、 生 


Fig. 3 Distribution of SSRs in exons of Blattella germanica 


genome based on repeat types 


2.5 ”对 外 显 子 中 含有 微 卫 星 的 基因 进行 分 析 

对 外 显 子 中 含有 微 卫 星 的 基因 进行 BLAST, 结 
果 中 的 E-value 和 序列 一 致 性 分 布 情况 如 图 4 所 示 。 
由 图 可 知 ,41. 3% 的 序列 高 度 同 源 (< 1e-100)， 
25.8% 中 度 同 源 (1e-100 ~ 1e-50)。 序 列 一 致 性 的 
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图 4 含 微 卫星 的 基因 Blast 结果 | 








P E-value 值 ( A) 和 核 痛 酸 序列 一 致 怕 


物 调节 和 色素 沉着 。 参 与 绑 定 活动 的 基因 主要 与 核 
背 酸 绑 定 活动 相关 , 占 绑 定 活动 的 32.8% 。 

KEGG 通路 分 析 结 果 表 明 : 共 有 571 条 基因 获 
得 了 KO number, 它们 参与 的 通路 信息 如 图 6 所 示 。 
在 这 些 基 因 中 ,与 代谢 过 程 相 关 的 基因 最 多 (380 ) ， 





其 次 是 与 机 体系 统 相 关 的 基因 (276 ) ,与 遗传 信息 
进程 相关 的 基因 最 少 (92 ) 。 
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E(B) 的 分 布 情况 


Fig. 4 Distribution of E-value (A) and nucleotide sequence identities (B) in Blast of microsatellite-containing sequence 
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Fig. 5 GO classifications of microsatellite- 


containing sequences from Blattella germanica 
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图 6 德国 小 嫌 含 有 微 ] 
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B 星 的 基因 参与 的 通路 类 别 


Fig. 6 Catalogs of metabolic pathway in microsatellite-containing sequences from Blattella germanica 


3 讨论 


微 卫星 是 生物 基因 组 中 变异 频率 最 快 的 序列 ， 
其 数量 和 类 型 在 不 同 物种 基因 组 中 变化 较 大 。 在 结 
构 基 因 中 微 卫星 重复 类 型 或 重复 次 数 的 变化 会 引起 
基因 表达 的 变化 ( 阁 毛 毛 等 , 2011 ) 。 

在 德国 小 蚁 的 基因 组 中 , 三 碱 基 重 复 类 型 的 微 
卫星 数量 最 多 , 占 微 卫 星 总 数 的 37. 54% ,在 已 报道 
的 节肢 动物 基因 组 微 卫 星 分 布 情况 中 是 较为 少见 




















的 ,目前 仪 发现 二 斑 叶 螨 ( Grbic et al., 2011; 汪 自 立 
等 , 2013 ) 与 之 相似 。 而 其 他 的 节 胶 动物 ,如 中 国 对 
由 Frenneropenaeus chinensis( 高 焕 等 , 2004) .日 本 才 
对 虾 Marsupenaeus japonicus( 变 生 等 , 2007) 西方 蜜 
蜂 Apis mellifera( 魏 朝 明 等 ，2007 ) 、 金 小 蜂 Nasonia 
(Pannebakker et al.，2010 ) 、 三 六 梭子蟹 Portunus 
trituberculatus ( 宋 来 鹏 等 ，2008 )、 腹 果 蝇 
Drosophila melanogaster ( Schug et al., 1998 ) 等 以 二 
碱 基 重 复 类 型 最 多 , 肩 突 硬 蝗 rodes scapularis( 汪 自 
立 等 ,2013 ) 以 单 碱 基 重复 类 型 为 主 、 赤 拟 谷 次 
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Tribolium castaneum( 张 琳 琳 等 , 2008 ) 以 六 碱 基 重复 
类 型 为 主 。 三 碱 基 重 复 类 型 的 微 卫 星 不 仅 在 德国 小 
基因 组 中 占 的 比例 最 大 , 而 且 在 编码 区 也 以 三 碱 
基 类 型 微 卫 星 为 主 , 占 编码 区 微 卫星 总 数 的 60. 16% 。 
与 其 他 类 型 微 卫 星相 比 , 三 碱 基 重 复 类 型 微 卫星 对 
基因 读 码 框 的 改变 影响 最 小 ,是 基因 编码 区 微 卫 星 
在 基因 组 中 得 以 稳定 保存 的 重要 机 制 ( 净 毛 毛 等 ， 
2011; 刘 芋 靖 等 , 2011) 。 

在 德国 小 蚁 的 微 卫星 中 ,不 管 是 哪 种 碱 基 类 型 ， 
随 着 碱 基 重复 次 数 的 增加 , 微 卫 星 的 个 数 整体 上 呈 
现 减少 的 趋势 ,这 可 能 与 微 卫 星 的 长 度 有 关 , 微 卫星 
长 度 越 长 ,不 稳定 性 越 高 ( Wierdl et al., 1997) ,变异 
速率 越 快 ,受到 的 选择 压力 越 大 ( 刘 苹 靖 等 , 2011 ) 。 
Harr 和 Schlitterer( 2000 ) 认为 ,长 微 卫 星 的 缺乏 可 
能 是 由 于 它们 有 下 调 的 突变 偏好 ,并 且 存 在 时 间 短 。 
Fllegren( 2000) 在 研究 人 类 DNA 序列 的 微 卫星 时 也 
发 现 ,在 基因 座 上 ,长 等 位 基因 倾向 变 成 较 短 的 长 
度 , 从 而 阻止 无 限 增长 ,因此 微 卫 星 的 长 度 一 般 会 维 
持 在 一 定 范围 内 。 小 归 的 微 卫 星 重复 次 数 主要 变化 
范围 在 4 ~ 30 次 , 占 微 卫星 总 数 的 98. 82% 。 进 一 
步 分 析 得 到 高 重复 次 数 的 微 卫星 分 别 是 :TA，TAT 
和 GTAT ,它们 都 位 于 基因 间 区 ,这 可 能 与 基因 中 太 
长 的 微 卫星 会 增加 突变 风险 有 关 。 

重复 的 DNA 序列 可 以 通过 复杂 的 环 - 折 著 结构 
形成 各 种 各 样 的 DNA 结构 ,包括 (CCG), 发 来 结构 、 
(GGGG) ,发 来 结构 、(GAA),A(CTT), 形 成 的 二 重 
三 叶 草 结构 等 ,这 些 特殊 的 基因 结构 形成 的 基因 可 
能 与 生物 学 功能 相关 ( Catasti ef ol.，1999 ) 。 德 国 小 
赚 共 有 2 372 个 微 卫 星 在 外 显 子 上 ,位 于 1 481 个 基 
因 上 ,G0 注释 结果 表明 这 些 基因 在 所 参与 的 细胞 
组 件 、 分 子 功 能 及 生物 学 过 程 的 分 布 情况 与 德国 小 
景 转录 组 中 的 注释 结果 (Zhou et al., 2014 ) 相似 ,说 
明了 微 卫 星 在 基因 组 中 的 分 布 较为 均匀 。 通 路 分 析 
结果 表明 :这 些 基 因 中 ,与 代谢 过 程 相关 的 基因 最 
多 ,主要 是 与 代谢 通路 相关 ; 与 机 体系 统 相 关 的 次 
之 ,主要 是 与 内 分 泌 系 统 、 神 经 系统 、 消 化 系统 和 人 免疫 
系统 相关 ;与 遗传 信息 进程 相关 的 基因 最 少 。 不 管 怎 
样 ,外 显 子 的 微 卫 星 会 增加 这 些 基 因 的 突变 风险 。 

随 着 测序 技术 的 快速 发 展 , 测 序 时 间 短 且 价 格 
越 来 越 便宜 ,基因 组 数据 将 越 来 越 多 ,为 我 们 进一步 
系统 深入 分 析 不 同 生 物 类 群 基因 组 中 微 卫 星 的 分 布 
规律 及 功能 创造 了 条 件 。 德 国 小 赚 基 因 组 微 卫 星 分 
析 为 进一步 研究 微 卫星 功能 、 微 卫星 分 子 标记 及 该 
害虫 的 有 效 防 控 措 施 打下 了 基础 。 
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